# -*-coding:utf-8-*-
import xlrd
import pprint

book = xlrd.open_workbook("../../data/chp4/SOWC 2014 Stat Tables_Table 9.xlsx")

sheet = book.sheet_by_name("Table 9 ")

data = {}

# nrows 遍历所有行
# 在处理大型数据集时xrange比range要快一点
for i in xrange(14, sheet.nrows):

    row = sheet.row_values(i)

    country = row[1]

    data[country] = {
        'child_labor': {
            'total': [row[4], row[5]],
            'male': [row[6], row[7]],
            'female': [row[8], row[9]],
        },
        'child_marriage': {
            'married_by_15': [row[10], row[11]],
            'married_by_18': [row[12], row[13]],
        }
    }

    if country == "Zimbabwe":
        break


pprint.pprint(data)
# 对于复杂的数据结构(如字典)，用这种方法检查输出要容易很多。
